Skip to main content

2.9.2 Restrukturere fra paneldata til tverrsnittsdata

Datasett opprettet gjennom en av kommandoene import-panel eller reshape-to-panel er av typen panel-/long-format hvor gjentakende variabelobservasjoner organiseres vertikalt på record-nivå. Kommandoen reshape-from-panel gjør det mulig å endre datastrukturen til wide-format der opplysningene struktureres horisontalt på variabelnivå med én record per enhet.

Alle variabler i paneldatasettet du står i restruktureres til wide-format etter at kommandoen er kjørt, og variablene får suffiks basert på undernivået gitt ved hjelpevariabelen date@panel1. Merk at også variabler for faste opplysninger vil dupliseres med suffiks knyttet til undernivå (selv om de ikke endrer seg over tid). Dette kan løses ved å slette overflødige variabler etter at datasettet er ferdig konvertert.

Illustrasjonen nedenfor viser hvordan restruktureringen logisk foregår under panseret. Eksempelet viser et datasett med long-format som inneholder variablene sivstand, lønn og kjønn, i tillegg til hjelpevariabelen date@panel som inneholder verdien til undernivået, i dette tilfellet årene 2018-2020 (tosifret). Datasettet konverteres til wide-format ved hjelp av kommandoen reshape-from-panel. Merk at man ikke spesifiserer variabler eller prefiks. Alle variabler gjøres om til wide-format med tilhørende suffiks, inkludert variabler som måler faste opplysninger som kjønn.

Kommandoen reshape-from-panel kompletterer ved å gjøre det mulig å konvertere frem og tilbake mellom wide- og long-format, noe som gir følgende muligheter:

  • Det er ikke mulig å importere nye variabler inn i et datasett opprettet ved hjelp av import-panel. Dette kan løses ved å bruke reshape-from-panel til å konvertere til wide-format, for så å importere nye variabler etter behov ved hjelp av import. Når man har de variablene man trenger, kan man konvertere tilbake til panel-/long-format igjen gjennom å bruke kommandoen reshape-to-panel.

  • Paneldatasett gir mindre fleksibilitet når man skal sammenlikne og gjøre operasjoner over variabelverdier på tvers av undernivå (over tid). Eksempler på dette er når man vil lage en variabel som består av gjennomsnittet av lønn i 2019 og 2020, eller når man vil lage en betingelse som baserer seg på tilfeller der lønn i 2020 er større enn 2019. Også dette kan løses ved å konvertere til wide-format, for så å gjøre de ønskede operasjoner og konvertere tilbake etterpå.


\rhd Eksempel: Restrukturere datasett fra long- til wide-format

Footnotes

  1. For klassiske paneldatasett som lages ved bruk av kommandoen import-panel, vil suffiksene bli litt annerledes enn forventet. Når man bruker tabulate-panel eller summarize-panel på slike datasett, vil det se ut som at undernivået har verdier av typen «YYYY-MM-DD», men dette gjelder bare som visningsformat. De faktiske verdiene for date@panel bruker i dette tilfellet referansedatoer som verdiformat (antall dager målt fra 1/1 1970). Dette løser man ved å døpe om variabelnavnene med kommandoen rename etterpå.